DCASE 2024を参考に工夫を考える
from 卒論におけるSEDの工夫を考える
DCASE 2024を参考に工夫を考える
LOCAL AND GLOBAL FEATURES FUSION FOR SOUND EVENT DETECTION WITH HETEROGENEOUS TRAINING DATASET AND POTENTIALLY MISSING LABELS
クロスアテンション
BEATsとCRNNの中間層の特徴を使って学習
Confident Mean Teacher
Mean Teacherの改良版
Improving Audio Spectrogram Transformers for Sound Event Detection Through Multi-Stage Training
二段階学習
事前学習済みモデル3種でアンサンブル学習し,擬似ラベル(強ラベル)を生成
擬似ラベルを使って全体を学習
SOUND EVENT DETECTION BASED ON AUXILIARY DECODER AND MAXIMUM PROBABILITY AGGREGATION FOR DCASE CHALLENGE 2024 TASK 4
補助デコーダで学習を安定させる
他
後で
? フロントエンドは並列するか連結するか
? バックエンドで時間依存性を学習?